统计
Bioestadística Aplicada Nivel Intermedio

Distribuciones
Muestrales

La media y la proporción como variables aleatorias · Teorema Central del Límite · Aplicaciones en inferencia estadística

5.1 Distribución de la media de la muestra — μ, σ, TCL, poblaciones normales
5.3 Distribución de la proporción de la muestra — P̂, μ, σ, normalidad para muestras grandes

Ref.: Shafer, G. & Zhang, Z. (2012). Introductory Statistics. Saylor Academy. Capítulo 6.

🎯
Diapositiva 02 · Objetivos
Al terminar esta clase podrás…
1
Explicar por qué la media muestral X̄ es una variable aleatoria con su propia distribución de probabilidad, media y desviación estándar.
2
Aplicar las fórmulas μ = μ y σ = σ/√n para calcular la media y desviación estándar de la distribución muestral.
3
Enunciar y aplicar el Teorema Central del Límite: para n ≥ 30, X̄ es aproximadamente normal, independientemente de la distribución poblacional.
4
Calcular probabilidades sobre X̄ utilizando la estandarización Z = (X̄ − μ) / σ y la tabla normal.
5
Describir la distribución muestral de la proporción P̂, verificar la condición de normalidad y calcular probabilidades sobre proporciones.
📊
Diapositiva 03 · Sección 5.1 — Idea central
5.1 Distribución de la media de la muestra
⚖️ Idea central
La media muestral no es un número fijo: varía de muestra en muestra. Es una variable aleatoria con su propia distribución de probabilidad, media y desviación estándar. Comprender esta variabilidad es la base de toda inferencia estadística.
🔢 La media muestral como variable aleatoria
Notación
  • (mayúscula) = la media muestral como variable aleatoria
  • (minúscula) = los valores particulares que toma
  • Cada muestra de tamaño n produce un valor diferente de x̄
Propiedades
Como variable aleatoria, X̄ tiene:
  • Una media: μ
  • Una desviación estándar: σ
  • Una distribución de probabilidad
📐 Fórmulas fundamentales
Media de la distribución muestral
μ = μ
La media de X̄ es igual a la media poblacional μ. La media muestral es un estimador insesgado de μ.
Desviación estándar de la distribución muestral (Error estándar)
σ = σ / √n
Donde n = tamaño de muestra. A mayor n, menor variabilidad de X̄ alrededor de μ.
Diapositiva 04 · Sección 5.1 — Ejemplo resuelto
Ejemplo: equipo de remeros — distribución de
Datos del problema
Cuatro remeros pesan 152, 156, 160 y 164 lbs. Se extraen todas las muestras con reemplazo de tamaño n = 2. Encuentra la distribución de probabilidad, media y desviación estándar de X̄.
📋 Distribución de probabilidad de X̄
x̄ (lbs)P(X̄ = x̄)Observación
1521/16Solo 1 forma posible
1542/16
1563/16
1584/16Valor más probable (centro)
1603/16
1622/16
1641/16Solo 1 forma posible
16 muestras equiprobables
Hay 4 × 4 = 16 muestras posibles con reemplazo. La distribución ya comienza a parecerse a una campana, aunque la población era uniforme.
🔢 Cálculo de μ y σ
Media de la distribución de X̄
μ = Σ x̄·P(x̄) = 158
Coincide exactamente con la media poblacional μ = 158.
Desviación estándar
σ = √10 = σ/√n = √20/√2
Población: σ = √20. Con n = 2: σ = √20/√2 = √10. ✓
Conclusiones clave
  • μ = μ (insesgado)
  • σ < σ (promedios varían menos que datos individuales)
  • La distribución ya tiene forma de campana aunque la población era uniforme
🏔️
Diapositiva 05 · Sección 5.1
Teorema Central del Límite
🏔️ Teorema Central del Límite (TCL)
Para muestras de tamaño n ≥ 30, la distribución muestral de X̄ es aproximadamente normal, con media μ = μ y desviación estándar σ = σ/√n, independientemente de la forma de la distribución poblacional. A mayor n, mejor la aproximación.
📈 Efecto del tamaño de muestra
  • Con n = 1: la distribución de X̄ = distribución de la población
  • Con n = 5, 10: la distribución se va acercando a la campana
  • Con n ≥ 30: X̄ es prácticamente normal en la mayoría de los casos
  • Cuanto mayor es n, más estrecha y centrada es la distribución de X̄
Caso especial — Población normal
Si la población ya es normal, entonces X̄ es exactamente normal para cualquier n, sin importar el tamaño de muestra.
🎯 Dos variables aleatorias distintas
1️⃣
X — Medición individual
Distribución de la población. Media = μ, desviación estándar = σ. Forma desconocida en general.
2️⃣
X̄ — Media muestral
Distribución muestral. Media = μ, desviación estándar = σ/√n. Aproximadamente normal para n ≥ 30 (TCL).
Importancia práctica
El TCL permite calcular probabilidades sobre X̄ aunque no conozcamos la distribución de la población.
🧮
Diapositiva 06 · Sección 5.1 — Ejemplo resuelto
Cálculo de probabilidades sobre — Ejemplos
Estandarización de X̄
Z = (X̄ − μ) / σ = (X̄ − μ) / (σ/√n)
Una vez estandarizada, usar la tabla Z normal. Siempre usar σ, nunca σ directamente.
🚗 Ejemplo A — Impuestos vehiculares
Datos
μ = $13,525 · σ = $4,180 · n = 100
¿Cuáles son μ y σ?
Solución
μ = $13,525
σ = 4,180 / √100 = $418
El error estándar es $418, mucho menor que la σ poblacional ($4,180).
🏎️ Ejemplo B — Vida útil de neumáticos
Datos
μ = 38,500 mi · σ = 2,500 mi · n = 5 · Población normal
P(X̄ < 36,000)?
Solución (en miles de millas)
σ = 2.5/√5 = 1.118
Z = (36 − 38.5)/1.118 = −2.24
P(X̄ < 36) = P(Z < −2.24) = 0.0125
Solo 1.25% de muestras tienen media inferior a 36,000 mi. Nota: n = 5 pero la población es normal, por lo que aplica sin TCL.
📐
Diapositiva 07 · Sección 5.1 — Ejemplo paso a paso
Ejemplo completo — TCL con n = 50
Problema
X̄ es la media de una muestra aleatoria de tamaño n = 50 extraída de una población con μ = 112 y σ = 40.
a) Encuentra μ y σ · b) P(110 < X̄ < 114) · c) P(X̄ > 113)
a
Parámetros de X̄

μ = 112 · σ = 40/√50 = 5.657. Como n = 50 ≥ 30, se aplica el TCL.

b
P(110 < X̄ < 114)

Z1 = (110−112)/5.657 = −0.35
Z2 = (114−112)/5.657 = +0.35
P = 0.6368 − 0.3632 = 0.2736

c
P(X̄ > 113)

Z = (113−112)/5.657 = 0.18
P(Z > 0.18) = 1 − 0.5714 = 0.4286

💡 Reflexión importante
¿Podemos calcular P(X > 113)?
Para un individuo (X), no podríamos calcular P(X > 113) porque no conocemos la distribución de la población, solo su media y σ.

Para la media muestral (X̄), sí podemos porque el TCL garantiza que X̄ es aproximadamente normal.
Regla de estandarización
Siempre estandarizar con σ = σ/√n (no con σ) cuando se trabaja con X̄. Usar σ directamente sería el error más común.
🎲
Diapositiva 08 · Sección 5.3 — Idea central
5.3 Distribución de la proporción de la muestra
🎲 Idea central
La proporción muestral (P sombrero) también es una variable aleatoria que varía de muestra en muestra. Es el análogo de X̄ para variables categóricas: estima la proporción poblacional p.
📖 Definición y notación
Ejemplo numérico
Si en realidad el 43% de personas en una tienda compran algo:
p = 0.43 (proporción poblacional).

Si en una muestra de 200 personas, 78 compran:
p̂ = 78/200 = 0.39 (proporción muestral).
Conexión con X̄
Codifica: 1 si tiene la característica, 0 si no. Entonces p̂ = x̄ (media de los 0s y 1s). Por eso el TCL aplica también a P̂.
📐 Fórmulas de la distribución de P̂
Media de la distribución muestral de P̂
μ = p
P̂ es estimador insesgado de p.
Desviación estándar (error estándar de la proporción)
σ = √(pq/n)
Donde q = 1 − p. A mayor n, menor σ.
Distribución muestral (muestras grandes)
Para muestras grandes, P̂ es aproximadamente normal con media p y desviación estándar √(pq/n).
Diapositiva 09 · Sección 5.3
Condición de muestra grande para
Condición de normalidad
La distribución de P̂ es aproximadamente normal cuando el intervalo [p − 3σ, p + 3σ] se encuentra completamente dentro del intervalo [0, 1].
🔍 ¿Qué hacer cuando p es desconocida?
Verificación práctica
Si p no se conoce, sustituir con p̂ en la verificación:

Confirmar que el intervalo:
[ p̂ − 3√(p̂(1−p̂)/n) , p̂ + 3√(p̂(1−p̂)/n) ]

esté completamente dentro de [0, 1].
Nota sobre n = 30
La condición para P̂ es más exigente que simplemente n ≥ 30. Depende también del valor de p. Cuando p está cerca de 0 o de 1, se necesita un n mucho mayor.
📊 Estandarización de P̂
Estadístico Z para la proporción
Z = (P̂ − p) / √(pq/n)
Una vez verificada la normalidad, se usa la tabla Z normalmente.
EscenariopnNormal?
p cerca del extremo0.115❌ Muestra pequeña
p cerca del extremo0.1100✅ Aceptable
p central0.515✅ Aceptable
🗳️
Diapositiva 10 · Sección 5.3 — Ejemplo resuelto
Ejemplo completo — Proporción de votantes
Problema
El 38% de los votantes de una región apoya una propuesta. Se encuestan n = 900 votantes.
a) Verificar que P̂ es aproximadamente normal. b) P(|P̂ − 0.38| ≤ 0.05).
1
Calcular μ y σ

p = 0.38 · q = 0.62 · n = 900
μ = 0.38
σ = √(0.38 × 0.62 / 900) = 0.01618

2
Verificar normalidad

= 3(0.01618) ≈ 0.05
Intervalo: [0.38 − 0.05, 0.38 + 0.05] = [0.33, 0.43]
✅ Completamente dentro de [0, 1].

3
Calcular probabilidad

P(0.33 < P̂ < 0.43)
Z1 = (0.33 − 0.38)/0.01618 = −3.09
Z2 = (0.43 − 0.38)/0.01618 = +3.09
P = 0.9990 − 0.0010 = 0.9980

💬 Interpretación
📊
P = 0.9980 → 99.8% de probabilidad
Con una muestra de 900 votantes, hay un 99.8% de probabilidad de que la proporción muestral esté dentro de los 5 puntos porcentuales de la proporción real (0.38).
Lección
Muestras grandes hacen que la proporción muestral sea muy precisa. Por eso las encuestas políticas con n ≥ 1,000 tienen márgenes de error pequeños.
Relación con P(Z < ±3.09)
Que el intervalo de verificación sea exactamente [p ± 3σ] no es coincidencia: significa que verificar la condición de normalidad equivale a preguntar si la probabilidad de estar dentro de ±3σ cae en [0,1].
⚖️
Diapositiva 11 · Síntesis
Comparativa: distribución de vs.
CaracterísticaMedia muestral X̄Proporción muestral P̂
¿Qué estima?Media poblacional μProporción poblacional p
Media de la distribuciónμ = μμ = p
Error estándarσ = σ/√nσ = √(pq/n)
Condición de normalidad (TCL)n ≥ 30 (o población normal)[p − 3σ, p + 3σ] ⊂ [0,1]
EstandarizaciónZ = (X̄ − μ)/(σ/√n)Z = (P̂ − p)/√(pq/n)
Tipo de variableCuantitativa continuaCategórica (éxito/fracaso)
Relación fundamental
La proporción muestral P̂ es matemáticamente idéntica a la media muestral X̄ cuando la variable es binaria (0/1). Por eso el TCL aplica igual a ambas, y las fórmulas tienen la misma lógica: la media de la distribución muestral = parámetro poblacional, y el error estándar decrece como 1/√n.
✏️
Diapositiva 12 · Práctica
Ejercicio de comprensión
P1
Una población tiene μ = 50 y σ = 10. Se extrae una muestra de n = 25. ¿Cuál es σ?
  • a 10
  • b ✓ 2   (σ/√n = 10/√25 = 2)
  • c 0.4
P2
¿Para qué valor mínimo de n garantiza el TCL que X̄ es aproximadamente normal, sin importar la distribución poblacional?
  • a n ≥ 10
  • b n ≥ 20
  • c ✓ n ≥ 30
P3
Una población normal tiene μ = 100 y σ = 15. Para n = 9, ¿es X̄ aproximadamente normal?
  • a No, porque n < 30
  • b ✓ Sí, porque la población es normal, X̄ es normal para cualquier n
  • c Solo si el muestreo es con reemplazo
P4
Si p = 0.6 y n = 100, ¿cuál es σ?
  • a ✓ √(0.6 × 0.4 / 100) = 0.049
  • b √(0.6/100) = 0.077
  • c 0.6/√100 = 0.06
P5
¿Qué sucede con σ cuando el tamaño de muestra n se cuadruplica (de n a 4n)?
  • a Se divide entre 4
  • b ✓ Se divide entre 2 (σ/√(4n) = σ/(2√n) = σ/2)
  • c Permanece igual
P6
¿Cuál es la principal utilidad práctica del TCL en inferencia estadística?
  • a Nos dice la distribución exacta de la población
  • b ✓ Permite calcular probabilidades sobre X̄ aunque no conozcamos la distribución poblacional
  • c Garantiza que σ = σ
🏆
Diapositiva 13 · Actividad evaluable
Actividad: distribuciones muestrales aplicadas
🎯 Contexto clínico
Se sabe que la glucosa en ayuno en adultos sanos sigue una distribución con μ = 90 mg/dL y σ = 8 mg/dL. Además, el 12% de la población presenta prediabetes (glucosa ≥ 100 mg/dL). Tiempo: 30 min.
1️⃣
Distribución de X̄ (n = 64)

Calcula μ y σ para una muestra de n = 64 pacientes. ¿Se puede aplicar el TCL? Justifica. Calcula P(X̄ > 91.5).

2️⃣
Comparación de n

Repite el cálculo de P(X̄ > 91.5) para n = 16 y n = 256. ¿Qué observas al aumentar n? ¿Por qué la probabilidad cambia?

3️⃣
Distribución de P̂ (prediabetes)

Para una muestra de n = 200 pacientes con p = 0.12: calcula μ y σ, verifica la condición de normalidad, y calcula P(P̂ > 0.15).

4️⃣
Interpretación clínica

Si en una muestra de 200 pacientes encuentras p̂ = 0.18 (18% con prediabetes), ¿qué tan probable era obtener ese resultado o más extremo si la tasa real es 12%? ¿Qué conclusión sacarías?

Entregable
Resolución paso a paso: fórmulas, cálculos, valores Z, probabilidades e interpretación clínica de cada resultado.
Criterios
Uso correcto de fórmulas · Verificación de condiciones · Estandarización correcta · Interpretación en contexto biomédico
统计
✅ Clase completada

Ideas clave — Distribuciones Muestrales

5.1 — X̄ como V.A.
X̄ tiene distribución de prob., media μ = μ y desviación σ = σ/√n. Es estimador insesgado de μ.
Teorema Central
Para n ≥ 30, X̄ ≈ Normal(μ, σ/√n). Si la población es normal, aplica para cualquier n. Mayor n → distribución más estrecha y centrada.
Estandarización
Z = (X̄ − μ) / (σ/√n). Siempre usar σ, nunca σ directamente. Luego consultar tabla Z.
5.3 — P̂ como V.A.
μ = p · σ = √(pq/n). P̂ = X̄ para variables 0/1, por eso el TCL aplica.
Cond. normalidad P̂
Verificar que [p − 3σ, p + 3σ] ⊂ [0,1]. Más exigente que solo n ≥ 30 cuando p está cerca de 0 o 1.
BIBLIOGRAFÍA
Shafer, G. & Zhang, Z. (2012). Introductory Statistics. Saylor Academy. Chapter 6: Sampling Distributions. Disponible en: saylordotorg.github.io/text_introductory-statistics